Debido a que la pregunta sobre los ingresos mensuales es diferente
entre la encuesta del año 2022 y la encuesta levantada a partir de 2023
se extrajo el año de levantamiento. En el caso de levantamiento del año
de 2022 el calculó se hace con el monto y la periodicidad mensual;
mientras que, para los levantamientos a partir del año 2023 corresponde
al monto promedio mensual.
Esto acotó el universo de análisis a un
subconjunto de 16,492 casos, 10,209 correspondientes al año de 2022 y
6,283 correspondientes al año de 2023 y posteriores.
De esta población se identica que el 53.4% son mujeres y 46.6% son
hombres. Agrupando la población por intevalos de 5 años a partir de la
persona de menor edad reportada se identifica lo siguiente:
En
el caso de las mujeres la mayor proporción de los casos se da entre
quienes tienen de 28 a 33 años, lo que equivale al 16.74% de las
mujeres;
mientras que, en el caso de los hombres la mayor cantidad
de casos se da entre quienes tienen entre los 33 y 38 años de edad, lo
que equivale al 14.86%.
La edad promedio de toda la muestra es de 41
años de edad.
En la gráfica se observa que en esta población partir de los 25 años
el ingreso laboral alcanza el monto máximo y es a partir de ese momento
que los ingresos de las personas se estabilizan a lo largo de su vida
laboral; en algunos casos, entre los 32 y los 42 años el ingreso laboral
tiene un repunte; no obstante, de manera generalizada el ingreso laboral
se mantiene estable al mismo nivel que se tenía a partir de los 25 años
de edad.
En la gráfica también se observa que despúes de los 60
años el ingreso laboral comienza a reducirse, lo que en parte se explica
debido a que las personas abandonan su vida laboral y/o comienzan a
realizar actividades no formales, recordemos que en este punto no se
consideran los ingresos por transferencias o donaciones, únicamente se
tomaron para ello los ingresos laborales.
Mientras que la edad promedio de las personas en la muestra es 41
años, el ingreso promedio mensual asciende a los $4,342 mensuales, lo
que equivale a 144.73 pesos diarios en promedio para las jefas y jefes
del hogar, monto menor al del salario mínimo vigente en el año de 2022
(172.87 pesos diarios).
| Personas | Edad | Ingreso |
|---|---|---|
| 16,036 | 41 | 4,332 |
Al analizar el ingreso personal diferenciándolo por sexo mediante la
gráfica de cajas, la cual agrupa la población en cuartiles, se observa
que existe diferencia entre los ingresos reportados para los hombres
respecto de las mujeres; mientras que, la mediana de la población en
general es de $4,000 mensuales; en el caso de los hombres, esta es de
$4,800 mensuales y el de las mujeres es de $3,000 mensuales. En el caso
de la media del ingreso de los hombres, ésta es de $5,160.01; mientras
que, la media de las mujeres es de $3,628.44.
Nota: El uso de la
mediana es una medida más adecuado cuando existen valores atípicos
alejados del resto de los datos, como en este caso, ya que la media es
más sensible a estos valores.
| Estadístico | Valor |
|---|---|
| Estimado de la diferencia de medias: $ | 1530.34954 |
| t-valor | 22.90272 |
| gl | 14834.55023 |
| p-valor | 0.00000 |
| Intervalo de Confianza Inferior: $ | 1399.37492 |
| Intervalo de Confianza Superior: $ | 1661.32416 |
| Ingreso medio hombres: $ | 5154.30822 |
| Ingreso medio mujeres: $ | 3623.95868 |
Dado que p-valor < 0.05 se confirma la hipótesis alterna,
existe una diferencia significativa entre la media de los ingresos de
los hombres y las mujeres.
| Estadístico wilcox | Valor |
|---|---|
| Método | Wilcoxon rank sum test with continuity correction |
| Datos | ingresos_hombres and ingresos_mujeres |
| W | 41572131 |
| p-value | 2.63191385024848e-237 |
| Hipótesis alternativa | two.sided |
Cuando revisamos la relación entre los años de escolaridad y el monto
de los ingresos laborales es más significativo observar como los
ingresos mejoran cuando el número de años coincide con la conclusión del
nivel escolar a diferencia de quienes reportan el nivel trunco
inconcluso en función del número de años, ya que los ingresos en esos
casos no parecen mostrar cambios significativos.
Los casos que se
ubican en el cero en la línea horinzontal representan a aquellas
personas que no resportaron el dato de escolaridad; los años de
escolaridad se consideraron a partir del primer año de primaria, de
manera que, quienes reportaron haber concluido los seis años de
escolaridad representan a aquellos que concluyeron en nivel de primaria
y así sucesivamente.
Se observa que los ingresos de algunos empleos relacionados con la presencia de mayor capital intelectual tienen un ingreso ligeramente superior al resto, en este caso: FUNCIONARIO, DIRECTOR Y JEFES; PROFESIONISTAS Y TÉCNICOS y TRABAJADORES AUXILIARES EN ACTVIDADES ADMINISTRATIVAS. En el caso particular corresponde a quines reportan el empleo de AYUDANTE DE UN RANCHO O NEGOCIO FAMILIAR SIN RETRIBUCIÓN presenta mayores ingresos ya que el trabajo agrícola presenta ingresos por levantamiento de cosecha o venta de ganado por ejemplo.
Para este propósito utilizamos la Ecuación de Mincer, esta se
basa en un modelo semilogarítmico que se utiliza para estimar el retorno
de la educación función de los ingresos laborales.
El cálculo se
realiza considerando el logaritmo de los ingresos como variable
dependiente y los años de educación, la experiencia laboral y la
experiencia laboral al cuadrado para capturar los efectos de no lineales
como variables independientes.
Su resultado permite identificar el
incremento en los ingresos como resultado de los años de
escolaridad.
Considerando que los años de escolaridad y la
experiencia no son las únicas variable que inciden en el monto del
ingreso personal, para mejorar la predicción del modelo se recomienda
integrar variables como: el sexo, la región y la geografía entre otras
variables.
##
## Resultados de los Modelos de la ecuación de Mincer
## ======================================================================================================
## Dependent variable:
## ----------------------------------------------------------------------------------
## log_im
## Modelo 1 Modelo 2 Modelo 3
## (1) (2) (3)
## ------------------------------------------------------------------------------------------------------
## anios_estudio 0.099*** 0.107*** 0.107***
## (0.002) (0.003) (0.003)
##
## anios_experiencia 0.004*** 0.010***
## (0.001) (0.002)
##
## anios_experiencia_2 -0.0001***
## (0.00003)
##
## Constant 6.815*** 6.643*** 6.573***
## (0.022) (0.037) (0.043)
##
## ------------------------------------------------------------------------------------------------------
## Observations 15,910 15,910 15,910
## R2 0.104 0.106 0.107
## Adjusted R2 0.104 0.106 0.107
## Residual Std. Error 0.985 (df = 15908) 0.984 (df = 15907) 0.984 (df = 15906)
## F Statistic 1,850.398*** (df = 1; 15908) 944.208*** (df = 2; 15907) 633.309*** (df = 3; 15906)
## ======================================================================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
##
## Resultados de los Modelos de la ecuación de Mincer
## ====================================================================================================
## Dependent variable:
## --------------------------------------------------------------------------------
## log_im
## Modelo 4 Modelo 5 Modelo 6
## (1) (2) (3)
## ----------------------------------------------------------------------------------------------------
## anios_estudio 0.107*** 0.107*** 0.107***
## (0.003) (0.003) (0.003)
##
## anios_experiencia 0.009*** 0.009*** 0.009***
## (0.002) (0.002) (0.002)
##
## anios_experiencia_2 -0.0001*** -0.0001*** -0.0001***
## (0.00003) (0.00003) (0.00003)
##
## Mujer -0.155***
## (0.016)
##
## Hombre 0.155*** 0.165***
## (0.016) (0.016)
##
## municipio 0.004***
## (0.001)
##
## Constant 6.675*** 6.520*** 6.421***
## (0.044) (0.043) (0.046)
##
## ----------------------------------------------------------------------------------------------------
## Observations 15,910 15,910 15,910
## R2 0.112 0.112 0.114
## Adjusted R2 0.112 0.112 0.114
## Residual Std. Error 0.981 (df = 15905) 0.981 (df = 15905) 0.980 (df = 15904)
## F Statistic 502.454*** (df = 4; 15905) 502.454*** (df = 4; 15905) 409.726*** (df = 5; 15904)
## ====================================================================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
Se introduce la variable geográfica de municipio (donde habita la
persona), que es significativa y positiva en 0.4% incrementa el ingreso
de acuerdo con el muncipio en que habita la persona.
##
## Resultados de los Modelos de la ecuación de Mincer
## ====================================================================================================================
## Dependent variable:
## ---------------------------------------------------------------------------------
## log_im
## Modelo 7 Modelo 8 Modelo 9
## (1) (2) (3)
## --------------------------------------------------------------------------------------------------------------------
## anios_estudio 0.105*** 0.103*** 0.043***
## (0.003) (0.003) (0.004)
##
## anios_experiencia 0.008*** 0.008*** 0.017***
## (0.002) (0.002) (0.002)
##
## anios_experiencia_2 -0.0001*** -0.0001*** -0.0003***
## (0.00003) (0.00003) (0.00003)
##
## educ_completoLicenciatura Completa 0.728***
## (0.046)
##
## educ_completoOtros 0.594***
## (0.057)
##
## educ_completoPosgrado 1.184***
## (0.122)
##
## educ_completoPreparatoria Completa 0.610***
## (0.026)
##
## Hombre 0.221*** 0.213*** 0.216***
## (0.016) (0.016) (0.016)
##
## regionMETROPOLITANA 0.133*** 0.144*** 0.128***
## (0.031) (0.030) (0.030)
##
## regionNORTE 0.329*** 0.338*** 0.323***
## (0.043) (0.043) (0.042)
##
## regionPERIFERICA 0.021 0.035 0.031
## (0.036) (0.036) (0.035)
##
## regionSUR -0.324*** -0.339*** -0.360***
## (0.036) (0.036) (0.035)
##
## np48nombreocupacion -0.010***
## (0.001)
##
## Constant 6.466*** 6.587*** 6.800***
## (0.051) (0.052) (0.052)
##
## --------------------------------------------------------------------------------------------------------------------
## Observations 15,910 15,910 15,910
## R2 0.136 0.142 0.168
## Adjusted R2 0.136 0.141 0.167
## Residual Std. Error 0.968 (df = 15901) 0.965 (df = 15900) 0.950 (df = 15897)
## F Statistic 314.087*** (df = 8; 15901) 291.455*** (df = 9; 15900) 266.997*** (df = 12; 15897)
## ====================================================================================================================
## Note: *p<0.1; **p<0.05; ***p<0.01
Aquí en lugar del Tipo de Ocupación o Empleo se introdujeron las
casos en los que se reportó haber concluido el nivel escolar (de acuerdo
con el número de años cursados para el nivel). Observandose qué tener el
nivel escolar concluido: Preparatoria, Licenciatura o Posgragrado son
significativos y positivos en todos los casos: Preparatoria 62%;
Licenciatura 75.1% y Postgrado 100.2%
1. la muestra no presenta una distribución normal, se considera
que dado que tamaño de la muestra es grande esta se aproxima a una
distribución normal por teorema de limite central, lo que permite
validar los resultados.
2. entre años_experiencia y
años_experiencia^2 existe colinealidad, el factor de inflación VIF es de
14, lo que es esperado por que años_experiencia^2 se obtienen al elevar
al cuadrado años_experiencia.
3. El R^2 y el R^2ajustado son
pequeños lo que significa que aún hay variables fuera del modelo que no
están consideradas que afectan el modelo.
4. Se observa que en todos
los modelos el estadístico F presenta valores significativos (***) y
grandes lo que permite considerar que las variables incorporadas ayudan
a explicar la variabilidad del ingreso.
5. A medida que se
incrementan variables el modelo se hace complejo y se reduce el valor de
F, sin embargo, en el modelo 9 al introducir el nivel de escolaridad
concluido aunque F baja, la R^2ajustada es mejor que en el resto de los
modelos.
Vamos a identificar si se cumple el supuesto de varianza constante para todos los valores de las variables independientes
##
## RESET test
##
## data: modelo
## RESET = 14.868, df1 = 2, df2 = 15895, p-value = 3.538e-07
##
## studentized Breusch-Pagan test
##
## data: modelo
## BP = 369.6, df = 12, p-value < 2.2e-16
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 6.7996e+00 5.3464e-02 127.1792 < 2.2e-16
## anios_estudio 4.3155e-02 4.1386e-03 10.4276 < 2.2e-16
## anios_experiencia 1.7217e-02 2.1816e-03 7.8921 3.164e-15
## anios_experiencia_2 -2.6649e-04 3.6442e-05 -7.3126 2.746e-13
## educ_completoLicenciatura Completa 7.2798e-01 4.7618e-02 15.2878 < 2.2e-16
## educ_completoOtros 5.9352e-01 5.7836e-02 10.2622 < 2.2e-16
## educ_completoPosgrado 1.1837e+00 1.0498e-01 11.2754 < 2.2e-16
## educ_completoPreparatoria Completa 6.0980e-01 2.7541e-02 22.1420 < 2.2e-16
## Hombre 2.1579e-01 1.5381e-02 14.0302 < 2.2e-16
## regionMETROPOLITANA 1.2843e-01 2.7465e-02 4.6762 2.947e-06
## regionNORTE 3.2255e-01 3.9853e-02 8.0935 6.211e-16
## regionPERIFERICA 3.1181e-02 3.2468e-02 0.9604 0.3369
## regionSUR -3.5967e-01 3.1137e-02 -11.5509 < 2.2e-16
##
## (Intercept) ***
## anios_estudio ***
## anios_experiencia ***
## anios_experiencia_2 ***
## educ_completoLicenciatura Completa ***
## educ_completoOtros ***
## educ_completoPosgrado ***
## educ_completoPreparatoria Completa ***
## Hombre ***
## regionMETROPOLITANA ***
## regionNORTE ***
## regionPERIFERICA
## regionSUR ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Esto indica que se rechaza la hipótesis nula (H₀) de homocedasticidad.
## idbeneficiario1 idvivienda_datos
## FALSE FALSE
## edad fechalevantamiento
## FALSE FALSE
## p36_parentesco curp
## FALSE FALSE
## desc_sexo idparentescojefe
## FALSE FALSE
## np43situacionconyugal preg51_estado_civil
## FALSE FALSE
## preg54_ocupaciondesarrollada p52_viveconlapareja
## FALSE FALSE
## aplica_como_indigena np48nombreocupacion
## FALSE FALSE
## p60_tienejefe p63_montoingreso
## FALSE FALSE
## p64_frecuenciapago año_levantamiento
## TRUE FALSE
## noasiste_nivel noasiste_anogrado
## FALSE TRUE
## leeryescribir region
## FALSE FALSE
## anios_experiencia log_im
## FALSE FALSE
## Mujer municipio
## FALSE FALSE
## anios_estudio anios_experiencia_2
## FALSE FALSE
## Hombre educ_completo
## FALSE FALSE